Es una agrupacion definida por el usuario de grupos y elementos relacionados.
Puede constar de uno o varios grupos junto con algunos o todos los elementos de estos grupos.
BD
Note
Important
Vamos a Importar la base de datos ya asignado anteriormente.
Categorizamos o agrupamos por valores que se le asignara para cada variable.
library(readxl)Caso_Aguacate_xls<-read_excel("avocado.csv..xlsx")library(epiDisplay)Caso_Aguacate_xls$cat_Aguacate <-ifelse(Caso_Aguacate_xls$`AveragePrice (PRECIO PROMEDIO)`<=1 , 'promedio-','promedio+')Caso_Aguacate_xls$cat_numero_total_vendido <-ifelse(Caso_Aguacate_xls$`Total Volume (NUMERO TOTAL DE AGUACATES VENDIDOS)`<=850644 , 'ventas menores','ventas mayores')Caso_Aguacate_xls$cat_numero_4046_vendido <-ifelse(Caso_Aguacate_xls$`NUMERO TOTAL DE AGUACATE CON PLU 4046-PEQUEÑO VENDIDOS`<=293008 , 'ventas menores de 4046','ventas mayores de 4046')Caso_Aguacate_xls$cat_numero_4225_vendido <-ifelse(Caso_Aguacate_xls$`NUMERO TOTAL DE AGUACATE CON PLU 4225-LARGO VENDIDOS`<=295154 , 'ventas menores de 4225','ventas mayores de 4225')Caso_Aguacate_xls$cat_numero_4770_vendido <-ifelse(Caso_Aguacate_xls$`NUMERO TOTAL DE AGUACATE CON PLU 4770-GRANDE VENDIDOS`<=22839 , 'ventas menores de 4770','ventas mayores de 4770')Caso_Aguacate_xls$bolsas_totales <-ifelse(Caso_Aguacate_xls$`Total Bags (BOLSAS TOTALES)`<=239639 , 'bolsas totales menores','bolsas totales mayores')Caso_Aguacate_xls$bolsas_pequeñas <-ifelse(Caso_Aguacate_xls$`Small Bags (BOLSAS PEQUEÑAS)`<=182194 , 'bolsas pequeñas menores','bolsas pequeñas mayores')Caso_Aguacate_xls$bolsas_grandes <-ifelse(Caso_Aguacate_xls$`Large Bags (BOLSAS GRANDES)`<=54338 , 'bolsas grandes menores','bolsas grandes mayores')Caso_Aguacate_xls$bolsas_extragrandes <-ifelse(Caso_Aguacate_xls$`XLarge Bags (BOLSAS EXTRAGRANDES)`<=3106 , 'bolsas extragrandes menores','bolsas extragrandes mayores')
🥑DETERMINAR SI HAY ASOCIACION ENTRE EL NUMERO DE AGUACATE DE NUMERO 4046 Y LAS BOLSAS TOTALES
bolsas totales menores bolsas totales mayores
ventas mayores de 4046 599 1865
ventas menores de 4046 14970 815
Note
Important
Como podemos visualizar que en las ventas mayores que se realizo para tipo 4046 se obtuvo 599 bolsas totales y fueron menores y 1865 fueron bolsas totales mayores.
En cambio en las ventas menores que se realizo para tipo 4046 se obtuvo 14970 bolsas totales y fueron menores y 815 fueron bolsas totales mayores.
📊TABLAS DE CONTINGENCIA:📊
📈OBTENER LAS PROPORCIONES DE LA TIPO CON REGION
Cell Contents
|-------------------------|
| N |
| Chi-square contribution |
|-------------------------|
Total Observations in Table: 18249
| Caso_Aguacate_xls$bolsas_totales
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales menores | bolsas totales mayores | Row Total |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas mayores de 4046 | 599 | 1865 | 2464 |
| 1074.827 | 6244.022 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas menores de 4046 | 14970 | 815 | 15785 |
| 167.778 | 974.677 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
Column Total | 15569 | 2680 | 18249 |
------------------------------------------|-------------------------|-------------------------|-------------------------|
#H1: LA VENTA DE AGUACATE CON NUMERO 4046 SE ASOCIA CON EL NUMERO TOTAL DE BOLSAS VENDIDAS
#H0: LA VENTA DE AGUACATE CON NUMERO 4046 NO SE ASOCIA CON EL NUMERO TOTAL DE BOLSAS VENDIDAS
PRUEBA ESTADISTICA…………………..
library(tigerstats)chisqtestGC(~cat_numero_4046_vendido+bolsas_totales, data = Caso_Aguacate_xls )
Pearson's Chi-squared test with Yates' continuity correction
Observed Counts:
bolsas_totales
cat_numero_4046_vendido bolsas totales menores bolsas totales mayores
ventas mayores de 4046 599 1865
ventas menores de 4046 14970 815
Counts Expected by Null:
bolsas_totales
cat_numero_4046_vendido bolsas totales menores bolsas totales mayores
ventas mayores de 4046 2102.14 361.86
ventas menores de 4046 13466.86 2318.14
Contributions to the chi-square statistic:
bolsas_totales
cat_numero_4046_vendido bolsas totales menores bolsas totales mayores
ventas mayores de 4046 1074.83 6244.02
ventas menores de 4046 167.78 974.68
Chi-Square Statistic = 8455.675
Degrees of Freedom of the table = 1
P-Value = 0
#Chi-Square Statistic = 8455.675
#Degrees of Freedom of the table = 1
#P-Value = 0 < 0.05 entonces podemos afirmar que se rechaza H0 , existe una asociacion entre ambas variables
📊PASOS PARA MEJORAR GRAFICO DE PRECIOS PROMEDIO DE AGUACATE
library(ggplot2)# gráfica con ggplot2ggplot(data=Caso_Aguacate_xls, aes(x=cat_Aguacate))+geom_bar()
📊Mejorando el gráfico
ggplot(data=Caso_Aguacate_xls, aes(x=cat_Aguacate))+geom_bar()+xlab("PRECIO PROMEDIO")+ylab("N° DE AGUACATE")+ggtitle("Distribución de precio de aguacate")
📊Mejorando el gráfico 2
grafico1<-ggplot(data=Caso_Aguacate_xls, aes(x=cat_Aguacate))+geom_bar(fill="red", width =0.5)+xlab("PRECIO PROMEDIO")+ylab("N° DE AGUACATE")+ggtitle("Distribución de precio de aguacate")grafico1+theme_dark()